На главную страницу второго семестра

Матрицы весов аминокислотных замен

Множественное выравнивание блока из базы данных BLOCKS, отвечающего белку SODC_ECOLI

Блок IPB001424:

Идентификатор: SOD_CU_ZN
AC блока IPB001424B
Ширина: 34
Количество поcледовательностей: 345

                                                                                                       
                                  5       1 0       1 5       2 0       2 5       3 0                  
C C S _ H U M A N |   :   G L E P G L H G L H V H Q Y G D L T N N C N S C G N H F N P D G A S   :   3 4
C C S _ M O U S E |   :   G L E P G L H G L H V H Q Y G D L T R D C N S C G D H F N P D G A S   :   3 4
C C S _ P I G | Q 6   :   G L K P G L H G L H V H Q F G D L T R N C N S C G D H F N P D G M S   :   3 4
C C S _ R A T | Q 9   :   G L E P G L H G L H V H Q Y G D L T K D C S S C G D H F N P D G A S   :   3 4
O 0 2 4 3 0 | 3 7     :   G L T P G L H G X H I H Q F G D T T N G C V S A G P H F N P H N K N   :   3 4
O 1 6 8 6 3 | 2 8     :   G L S K G L H G F H V H E F G D N T N G C M S S G P H F N P Y Q K E   :   3 4
O 1 8 4 8 3 | 8 0     :   G L T P G L H G F H V H Q Y G D Q T N G C T S A G G H Y N P Y G K T   :   3 4
O 2 2 3 7 4 | 3 6     :   G L K P G L H G F H V H A L G D T T N G C M S T G P H F N P D G K T   :   3 4
O 2 3 7 8 5 | 3 5     :   G L P P G D H A L I I H T Y G N I S N D W I S T G P P F K P A G A D   :   3 4
O 2 4 4 0 0 | 8 4     :   G L A P G L H G F H L H E F G D T T N G C I S T G P H F N P N G L T   :   3 4
O 4 8 6 5 4 | 4 0     :   G L A P G K H G F H L H E F G D T T N G C M S T G P H F N P Q K K T   :   3 4
O 6 1 2 6 0 | 6 1     :   G L A A G K H G F H I H E K G D T G N G C L S A G G H Y N P H K L S   :   3 4
O 6 5 3 2 5 | 1 3 1   :   G L S P G T H S W C I N E Y G D L T N G A A S T G S L Y N P F Q D Q   :   3 4
O 7 7 2 4 3 | 3 5     :   G L E K G E H G F H V H A F G D T T N G C V S A G P H F N P F G K N   :   3 4
O 7 7 2 5 3 | 7 4     :   G L T P G L H G F H N H Q Y G D M T N G C I S A G A H F N P F G K T   :   3 4
O 8 1 2 3 6 | 4 0     :   G L S P G F H G F H I H S F G D T T N G C I S T G P H F N P L N R V   :   3 4
O 8 1 3 5 2 | 3 6     :   G L K P G P H G F H V H A L G D T T N G C M S T G P H F N P D G K T   :   3 4
O 8 9 7 4 5 | 3 2     :   N L P R G L H G F H V H E Y G D T S N G C T S A G E H F N P T G M D   :   3 4
O 9 2 4 0 0 | 3 4     :   N L P R G L H G F H V H E Y G D T S N G C T S A G E H F N P T N E D   :   3 4
O 9 6 3 5 7 | 6 1     :   G M P P G K Y G L N I H E K G D L T N G C A N V Q G H L N P H G H D   :   3 4
P 9 0 9 5 6 | 8 5 5   :   T L P V G R H A V V L H Q F G D S S E G C S R V G A P F S K S L S P   :   3 4
P 9 3 8 0 0 | 3 6     :   G L K P G L H G F H V H A L G D T T N G C M S T G P H Y N P A S K E   :   3 4
P 9 3 8 0 1 | 3 6     :   G L K P G L H G F H V H A L G D T T N G C M S T G H D Y N P A S K E   :   3 4
Q 1 2 7 2 8 | 3 7     :   G L T E G L H G F H V H E F G D N T A G C T S A G P H F N P L S R K   :   3 4
Q 2 7 4 6 0 | 3 5     :   G L T P G K H G F H V H E K G D L T N A C A S T G G H F N P D K M D   :   3 4
Q 2 7 5 3 8 | 5 7     :   G L S P G L H G F H I H Q Y G D S T D G C T S A G P H F N P C K M N   :   3 4
Q 2 7 7 9 2 | 6 9     :   G L T P G L H G F H V H Q Y G D T T N G C I S A G P H F N P Y N Q T   :   3 4
Q 5 W C J 0 | 7 9     :   G L P P G Y H G F H V H E E A A C D V D N N E G P F Q S A G G H F H   :   3 4
Q 5 W U 9 8 | 5 7     :   N L P E G P H G F H L H K N A D C G N H G M H A E G H Y D P Q N T N   :   3 4
Q 5 X 2 U 0 | 5 7     :   N L P E G P H G F H L H K N A D C G N H G M D A E G H Y D P Q N T N   :   3 4
Q 5 Y N U 1 | 9 9     :   G L R P G F H G L H F H Q N G A C E P N S V A P T G G P A G D F L S   :   3 4
Q 5 Z F 6 6 | 3 6     :   G L K P G L H G F H V H A L G D T T N G C M S T G P H F N P A A K E   :   3 4
Q 5 Z T 1 7 | 5 7     :   N L P E G P H G F H L H K T A D C G N H G M H A E G H Y D P Q N T N   :   3 4
Q 6 0 F S 5 | 3 5     :   G L S K G K H G F H I H E F G D N T N G C T S A G A H F N P L Q Q T   :   3 4
Q 6 1 F T 4 | 8 4 0   :   S L P L G R H A V V L H Q F G D S S E G C S R V G A P F S K S L S P   :   3 4
Q 6 1 G I 6 | 5 9     :   G L T P G L H G F H V H Q Y G D S T N G C L S A G P H F N P F G K T   :   3 4
Q 6 1 I U 1 | 6 1     :   G L A A G K H G F H I H E K G D T G N G C L S A G S H Y N P H K L S   :   3 4
Q 6 2 L D 6 | 7 4     :   L P P N S D H A L Q V H E R G D C N A A D G S S A G A V F A P A A D   :   3 4
Q 6 3 W 8 7 | 7 4     :   L P P N S D H A L Q V H E R G D C N A A D G S S A G A V F A P A A D   :   3 4
Q 6 3 Z Z 7 | 1 2 0   :   G L S P G L H G I H V H E F G D I S N G C E S C G E H Y N P H R N S   :   3 4
Q 6 5 R U 9 | 9 2     :   G L T A G L H G F H L H Q N P S C A A G E K D G K K V A G L G A G G   :   3 4
Q 6 5 Y Q 0 | 6 1     :   G L A A G K H G F H I H E K G D T G N G C L S A G G H Y N P H K L S   :   3 4
Q 6 5 Y Q 2 | 3 6     :   G L K P G L H G F H V H A L G D T T N G C M S T G P H F N P V G K E   :   3 4
Q 6 6 E D 7 | 7 3     :   G L A P G I H G F H L H E K P S C A P G M K D G K A V P A L A A G G   :   3 4
Q 6 7 Y 0 8 | 1 0 4   :   G L S P G T H S W C I N E Y G D L T N G A A S T G S L Y N P F Q D Q   :   3 4
Q 6 8 1 F 4 | 5 9     :   G L S P G T H S W C I N E Y G D L T N G A A S T G S L Y N P F Q D Q   :   3 4
Q 6 9 4 A 4 | 6 8     :   G I A P G K H G F H V H E K G D L T N G C T S L A A H Y N P E K L A   :   3 4
Q 6 A 1 9 9 | 3 7     :   G L K P G P H G F H V H A L G D T T N G C M S T G P H X N P H G K E   :   3 4
Q 6 A 1 A 0 | 8 5     :   G L T P G P H G F H L H E F G D T T N G C I S T G P H F N P N G H T   :   3 4
Q 6 B 7 T 0 | 3 6     :   G L T P G K H G F H V H G F G D R T D G C T S A G A H F N P T K C N   :   3 4
Q 6 B 7 T 1 | 3 6     :   G L K P G K H G F H V H A F G D T T N G C V S A G A H F N P K G V D   :   3 4
Q 6 B 7 T 2 | 3 6     :   G L T P G K H G F H V H A F G D T T N G C V S A G P H F N P T G V D   :   3 4
Q 6 B P B 3 | 6 6     :   P T S G G P F S Y H V H E A P V P S D G N C T G T K L H L D P Y N G   :   3 4
Q 6 B Y V 5 | 7 1     :   P K E G G P F Q Y H I H E N L V P S D G N C D L V G L H F N P Y D A   :   3 4
Q 6 D T U 3 | 3 6     :   G L K P G L H G F H V H A L G D T T N G C M S T G P H F N P A G K E   :   3 4
Q 6 I Y F 2 | 3 8     :   G L T P G E H G F H V H A F G D N T N G C I S A G P H F N P H N K N   :   3 4
Q 6 L D S 4 | 3 6     :   G L T E G E H G F H V H Q Y G D N T Q G C T T A G P H F N P H S K K   :   3 4
Q 6 M A B 6 | 9 4     :   G L T P G K H G F H I H E F G D C G K N G E A A G A H F N P M N Q K   :   3 4
Q 6 M N 6 0 | 5 8     :   N L P P G E K A F H I H E K G L C T A P D F K S A G G H F N P D K K   :   3 4
Q 6 M R 0 6 | 7 8     :   G I K P G P H G F H I H E K G D C S A A D F S S A G G H F N P T K G   :   3 4
Q 6 N D 8 4 | 5 7     :   G L P P G E H A F H I H A V G K C E P P F T S A G G H F N P E N K K   :   3 4
Q 6 Q 2 4 8 | 3 7     :   G L T E G L H G F H L H E Y G D T T N G C I S T G A H F N P N K L T   :   3 4
Q 6 Q N T 5 | 6 4     :   L P P N T P H G F H V H Q Y G D I D T N G C Q S T A S H F N P F G A   :   3 4
Q 6 Q V Q 5 | 5 6     :   G L T P G K H G F H I H E K G D L T D G C A S T G G H Y N P D K V S   :   3 4
Q 6 Q X J 7 | 3 4     :   K L P R G N H G I H I H E F G D V S N G C T S A G E H F N P H H K Q   :   3 4
Q 6 R B Y 0 | 3 9     :   G L A P G N H G F H I H Q F G D Y S N G C I S A G A H F N P A N K N   :   3 4
Q 6 R T 1 6 | 5 8     :   G F T P G P H G L H V H E I G E C K A P R F E S S G N H F N P D D K   :   3 4
Q 6 R U W 1 | 3 8     :   G L T P G E H G F H V H A F G D N T N G C I S A G P H F N P Y N K N   :   3 4
Q 6 S C L 6 | 3 6     :   G L S K G L H G F H V H E F G D N T N G C T S A G P H F N P K G K E   :   3 4
Q 6 T 6 2 4 | 8 5     :   G L T P G L H G F H L H E Y G D T T N G C I S T G P H F N P N Q L T   :   3 4
Q 6 T 8 C 4 | 3 7     :   G L T P G L H G F H V H Q Y G D T T N G C I S A G P H F N P Y N K T   :   3 4
Q 6 T K F 5 | 3 6     :   G L T P G K H G F H V H E F G D R T D G C T S A G A H F N P T K C N   :   3 4
Q 6 T K F 6 | 3 6     :   G L K P G K H G F H V H A F G D A T N G C V S A G A H F N P K G V D   :   3 4
Q 6 T K F 7 | 3 6     :   G L T P G K H G F H V H A F G D T T N G C V S A G P H F N P T G V D   :   3 4
Q 6 V T E 9 | 3 5     :   L D A N A E R G F H V H E F G D N T N G C T S A G P H F N P H G K N   :   3 4
Q 6 V T W 0 | 3 4     :   N L P R G L H G F H V H E F G D T S N G C T S A G E H F N P T H R Q   :   3 4
Q 6 W 5 R 8 | 3 7     :   G L Q K G L H G F H V H E F G D N T N G C T S A G A H F N P L G K E   :   3 4
Q 6 X Z F 8 | 2 0 2   :   G L S P G K H A W S I N E F G D L T R G A A S T G K L Y S P P L G D   :   3 4
Q 6 Y Y W 6 | 8 6     :   G L T P G L H G F H L H E F G D T T N G C I S T G P H F N P N N L T   :   3 4
Q 7 0 C E 4 | 5 0     :   G L K P G L H G F H V H A L G D T T N G C M S T G P H F N P A G K E   :   3 4
Q 7 0 G L 0 | 4 0     :   G L A P G E H G F H V H E F G D N T N G C T S A G S H F N P F G K T   :   3 4
Q 7 1 4 V 4 | 7 1     :   G L A E G L H G F H I Y E N P S C E P K E K D G K L I A G L A T G G   :   3 4
Q 7 1 A E 6 | 3 4     :   N L P K G L H G F H V H E F G D M S N G C T S A G E H F N P T G S N   :   3 4
Q 7 1 S 3 1 | 3 6     :   G L K P G P H G F H V H A L G D T T N G C M S T G P H F N P A G K E   :   3 4
Q 7 2 Y H 5 | 5 8     :   G F T P G P H G I H V H E I G E C K A P R F E S S G N H F N P D N K   :   3 4
Q 7 3 S 0 6 | 8 0     :   V L S P G F H G L Q I H A V G K C E A N S T A P T G G S T G D F E S   :   3 4
Q 7 6 M X 3 | 9 4     :   G L T P G L H G F H L H E F G D T T N G C I S T G P H F N P N N L T   :   3 4
Q 7 7 Q 9 3 | 3 4     :   N L P R G L H G F H V H E Y G D T S N G C T S A G E H F N P T N E D   :   3 4
Q 7 J L 0 2 | 7 0 8   :   T L P V G R H A V V L H Q F G D S S E G C S R V G A P F S K S L S P   :   3 4
Q 7 N I L 3 | 8 0     :   G L L P G K Y P I H F H S K G K C V A P D F R S S R G V F D T H S L   :   3 4
Q 7 P X V 9 | 5 3 0   :   H R W A I T D E P P G K D F Y D W Q N R C V S A G G V Y N P F K A A   :   3 4
Q 7 Q 9 H 5 | 3 8     :   G L T P G K H G F H I H E K G D L T D G C A S T G G H Y N P D K V S   :   3 4
Q 7 Q D P 9 | 3 6     :   G L K P G D H G F H I H E F G D N T N G C M S T G A H F N P Y A K T   :   3 4
Q 7 Q I Q 8 | 1 3 0   :   L S H S G T F Q L N V H E C G D I S A G C S S V G D V Y D S S P I R   :   3 4
Q 7 Q J F 8 | 1 0 6   :   G L P V G K H A V H V H A F G D M R E G C K S T G P H F R S S I I G   :   3 4
Здесь вы видите выравнивание моего блока, но не полностью, а только первые 100 последовательностей. Раскраска приведена в соответствии с четырьмя степенями консервативности
Более 80% идентичности
Более 60% идентичности
Более 40% идентичности
Менее 40% идентичности

Веса аминокислотных замен

Вычисление весов аминокислотных замен на основе множественного выравнивания блока IPB001424b из базы данных BLOCKS

Пара аминокислот nαβ pαβ qα qβ sαβ
Gly-Gly 163632 0,11095 0,17177 0,17177 4
Gly-Pro 23038 0,01562 0,17177 0,07177 -1
Gly-Gln 3590 0,00243 0,17177 0,01453 -2
nαβ — число соответствующих пар;
pαβ — доля данной пары;
qα(qβ) — частота встречаемости аминокислоты
sαβ — вес аминокислотной замены

Вычисление весов аминокислотных замен на основе множественных выравниваний 200 блоков из базы данных BLOCKS

Пара аминокислот nαβ pαβ qα qβ sαβ
Gly-Gly 7449873 0,03251 0,07083 0,07083 5
Gly-Pro 523493 0,00228 0,07083 0,04735 -3
Gly-Gln 934697 0,00408 0,07083 0,04207 -1
nαβ — число соответствующих пар;
pαβ — доля данной пары;
qα(qβ) — частота встречаемости аминокислоты
sαβ — вес аминокислотной замены

Сравнение весов аминокислотных замен

Пара аминокислот Блок IPB001424 200 блоков BLOSUM62
Gly-Gly 4 5 6
Gly-Pro -1 -3 -2
Gly-Gln -2 -1 -2
	По результатам посчета видно, что значения, полученные на основе вычислений по данным
блока IPB001424b, примерно такие же, как и по данным 200 блоков, и примерно такие же, как и по
данным BLOSSUM62, что говорит о том, что данный белок в среднем по своей эволюции незначительно
отличается  от большинства других. 
	Различные значения в матрице BLOSSUM62 обусловлены разной вероятностью различных мутаций,что
в свою очередь обусловлено различными свойствами и, соответственно, различными функциями аминокислот
Так, вес замены Gly-Gly высок, так как кислота меняется сама на себя т.е. на кислоту с очень близкими
(такими же) свойствами. Но вес замены Gly-Pro низкий, так как у них различные свойства, в частности
глицин обеспечивает дополнительную подвижность цепи в данном месте, а пролин - наооборот ограничивает
ее. Замена Gly-Gln так же встречается редко, так как глутамин имеет заряженную боковую группу.  

© Галкин Иван, 2005